تشخیص جمله و استخراج جملات با معنی از متن فارسی با استفاده از ویژگی های دستوری
پایان نامه
- وزارت علوم، تحقیقات و فناوری - دانشگاه سمنان - دانشکده برق و کامپیوتر
- نویسنده سیده طاهره میرعمادیان
- استاد راهنما خشایار یغمایی
- تعداد صفحات: ۱۵ صفحه ی اول
- سال انتشار 1391
چکیده
امروزه با گسترش کاربرد کامپیوتر، نیاز به استفاده از توانایی های غیر قابل چشم پوشی آن، در حوزه زبان شناسی به شدت احساس می شود.حوزه های پردازش زبان طبیعی و زبان شناسی رایانه ای به تلاش برای ماشینی کردن فرآیند زبان شناسی سنتی می پردازند.هدف اصلی در پردازش زبان طبیعی، ایجاد تئوری های محاسباتی از زبان،با استفاده از الگوریتم ها و ساختارهای داده ای موجود در علوم کامپیوتر است. بدیهی است که در راستای تحقق این هدف، نیاز به دانشی وسیع از زبان است و علاوه بر محققان علوم کامپیوتر ، نیاز به دانش زبان شناسان نیز در این حوزه می باشد. این پایان نامه به کمک ابزارهای زبانی دستور فارسی و اطلاعات آماری و نیز به کارگیری درخت تصمیم گیری سعی در ارائه روشی دارد که به کمک آن بخشی از نیازهای حوزه پردازش زبان طبیعی را پاسخ دهد.از جمله تحقیقاتی که با بکارگیری این ابزار در این پایان نامه انجام شده است، تعیین محدوده جملات فارسی می باشد که در آن، محدوده جملات که شامل ابتدا، انتها، وسط و ابتدا/ انتها می باشد به صورت خودکار شناسایی می شوند. هم چنین از این ابزار در شناسایی انواعی از کلمات مرکب که شامل اسم و صفت مرکب می باشنداستفاده شده است. زیرا وجود کلمات مرکب در جملات و پایین بودن دقت شناسایی این کلمات منجر به تولید جملاتی می شود که گاه به لحاظ دستوری و گاه به لحاظ معنایی نادرست می باشند. بنابراین یکی از راه حل های استخراج جملات بامعنی ، برطرف کردن این معضل می باشد. کلماتمرکب به صورت ترکیبی از دو یا چند کلمه با معنی مجزا در متن ظاهر می شوند و همین امر شناسایی آنها را به عنوان یک کلمه واحد، کمی مشکل می سازد. این روش قابل تعمیم به انواع دیگر کلمات مرکب از جمله حروف ربط و قید نیز می باشد. نتایج بدست آمده در هر دو تحقیق نشان دهنده کارا بودن این روش می باشد.
منابع مشابه
The effect of cyclosporine on asymmetric antibodies and serum transforming growth factor beta1 in abortion-prone model of mice CBA/J x DBA/2
كچ ي هد فده و هقباس : ي ک ي طقس زورب للع زا اه ي ،ررکم ا لماوع تلاخد ي ژولونوم ي ک ا رد ي ن قم طققس عون ي وراد دقشاب ي س ي روپسولک ي ،ن ح لدم رد طقس شهاک بجوم ي ناو ي CBA/j×DBA/2 م ي تنآ ددرگ ي داب ي اه ي ان و راققتم TGF-β لماوع زا عت مهم يي ن گلماح تشونرس هدننک ي سررب روظنم هب رضاح هعلاطم تسا ي ات ث ي ر اس ي روپسولک ي ن م رب ي از ا ي ن تنآ عون ي داب ي س و اه ي اکوت ي ن TGF...
متن کاملThe Study of Stressful Factors in Clinical Education for Nursing Students Studying in Nursing and Midwifery College in Khorramabad
کچ هدي پ شي مز هني فده و : شزومآ لاب يني شخب ساسا ي شزومآ مهم و راتسرپ ي تسا . و هنوگ ره دوج لکشم ي شزومآ رد لاب يني ، آراک يي هدزاب و ا ني شزومآ زا شخب راچد ار لکشم م ي دنک . فده اب رضاح شهوژپ سررب ي لماوع سرتسا از ي شزومآ لاب يني رد وجشناد ناي راتسرپ ي هدکشناد راتسرپ ي و يامام ي ماـجنا داـبآ مرـخ تسا هتفرگ . شور و داوم راک : رضاح هعلاطم کي هعلاطم صوت يفي عطقم ي تسا . د...
متن کاملاستخراج خودکار جملات همتراز انگلیسی-فارسی از متون مقایسهای با بهرهبرداری از اطلاعات نحوی
پیکرههای موازی همواره از غنیترین منابع در مباحث پردازش زبان طبیعی محسوب میشوند. این نوع پیکرهها شامل متون ترجمهشدۀ دو یا چند زبان هستند که در سطوح مختلف کلمه، عبارت و یا جمله همترازشدهاند. علیرغم کاربرد فراوان این نوع پیکرهها در مطالعات مختلف از جمله پژوهشهای زبانی، ترجمة ماشینی آماری و سامانههای خودکار بازیابی اطلاعات میان زبانی، متأسفانه همواره پژوهشگران با کمبود پیکرههای موازی مو...
متن کاملتشخیص لهجه های زبان فارسی از روی سیگنال گفتار با استفاده از روش های استخراج ویژگی کارآمد و ترکیب طبقه بندها
Speech recognition has achieved great improvements recently. However, robustness is still one of the big problems, e.g. performance of recognition fluctuates sharply depending on the speaker, especially when the speaker has strong accent and difference Accents dramatically decrease the accuracy of an ASR system. In this paper we apply three new methods of feature extraction including Spectral C...
متن کاملمقایسه تأثیر وضعیت طاق باز و دمر بر وضعیت تنفسی نوزادان نارس مبتلا به سندرم دیسترس تنفسی حاد تحت درمان با پروتکل Insure
کچ ی هد پ ی ش مز ی هن ه و فد : ساسا د مردنس رد نامرد ي سفنت سرتس ي ظنت نادازون داح ي سکا لدابت م ي و نژ د ي سکا ي د هدوب نبرک تسا طسوت هک کبس اـه ي ناـمرد ي فلتخم ي هلمجزا لکتورپ INSURE ماجنا م ي دوش ا اذل . ي هعلاطم ن فدهاب اقم ي هس عضو ي ت اه ي ندب ي عضو رب رمد و زاب قاط ي سفنت ت ي هـب لاتـبم سراـن نادازون ردنس د م ي سفنت سرتس ي لکتورپ اب نامرد تحت داح INSURE ماجنا درگ ...
متن کاملبهبود دقت در تشخیص احساسات با استفاده از سیگنالهای EEG با نوآوری در ترکیب استخراج ویژگی
مقدمه: از آنجا که احساسات نقش مهمی در زندگی روزمره انسان بازی میکند، ایجاد روشی هوشمند جهت بهبود قابلیت تشخیص احساسات از سیگنال الکتروانفسالوگرافی (EEG)، مبتنی بر تکنیکهای پردازش سیگنال، ضروری به نظر می رسد. بهعلاوه، استفاده از طبقهبند ماشین بردار پشتیبان بهینه شده با الگوریتم تکاملی ژنتیک، از نوآوریهای این پژوهش در بخش طبقهبندی میباشد. روش: روش پیشنهادی با تمرکز بر روی استخراج و طبقهب...
متن کاملمنابع من
با ذخیره ی این منبع در منابع من، دسترسی به آن را برای استفاده های بعدی آسان تر کنید
ذخیره در منابع من قبلا به منابع من ذحیره شده{@ msg_add @}
نوع سند: پایان نامه
وزارت علوم، تحقیقات و فناوری - دانشگاه سمنان - دانشکده برق و کامپیوتر
کلمات کلیدی
میزبانی شده توسط پلتفرم ابری doprax.com
copyright © 2015-2023